httrack est un célèbre aspirateur de sites web.
Le forum et la documentation d'Ubuntu-FR, de même que tous sites volumineux, ne doivent pas être aspirés automatiquement, sous peine de mise blocage de votre adresse IP par le site. L'aspiration de sites doit respecter une certaine éthique et doit être utilisée uniquement lorsqu'il y a un besoin d'accéder à certains contenus hors lignes. L'aspiration de sites exploite bien des ressources matérielles du site que vous téléchargez. Demandez l'autorisation au webmaster avant de procéder! N'oublions pas aussi que ça relève toujours de la proprieté intellectuelle.
Il existe 2 versions de httrack :
Installez le paquet avec synaptic après avoir activé les dépôts universe/multiverse (Catégories → Dépôts)
Votre navigateur doit être fermé avant de lancer webhttrack.
Nous allons nous intéresser ici à la version graphique, disponible dans le menu Applications ⇒ Internet ⇒ « WebHTTrack Website Copier »
Votre navigateur ouvre alors un nouvel onglet.
Des options plus avancées sont disponibles. N'hésitez-pas à expérimenter !
Crée un miroir:
httrack --mirror http://www.monsite.com
Mettre à jour le projet courant:
httrack --update
Nettoyage du cache et fichier log:
httrack --clean
Site officiel : http://www.httrack.com/